DriftSched: Programación adaptativa de QoS para inferencia GPU multiinquilino DriftSched optimiza la programación GPU multi-inquilino con compensación adaptativa de deriva de tokens, reduciendo latencia un 42% y mejorando QoS. 2026-06-03 · 1 min